Corpus for Benchmarking Clinical Speech De-identification
Dieses Paper stellt das SREDH-AICup-SHISprachkorpus vor, ein neu erstellter, zeitlich ausgerichteter Datensatz mit annotierten sensiblen Gesundheitsinformationen in Englisch und Mandarin, der als Benchmark für die Forschung zur automatisierten klinischen Sprachdeidentifizierung dient.